به کارگیریِ اطلاعاتِ زبانی در یک سیستمِ بازشناسیِ گفتار پیوسته فارسی

نویسندگان

محمد بحرانی

دانشگاه صنعتی شریف( آزمایشگاه پردازش گفتار) حسین صامتی

دانشگاه صنعتی شریف( آزمایشگاه پردازش گفتار)

چکیده

در این مقاله یک سامانۀ بازشناسی گفتار پیوسته برای زبان فارسی معرفی می شود و نقش مدل آوایی و مدل زبانی در آن مورد بررسی قرار می گیرد. مدل های آوایی با روش های مستقل از بافت و وابسته به بافت در این سامانه به کار رفته و نتایجِ به کارگیریِ آن ها ارائه شده است. مدل زبانیِ سه کلمه ای نیز با روش های مبتنی بر کلمه، مبتنی بر مقوله نحوی و مبتنی بر طبقه، با استفاده از پیکرۀ متنیِ زبانِ فارسی استخراج و در سامانۀ بازشناسی به کار گرفته شده است. همچنین مدل زبانیِ دستوری مبتنی بر دستور ساخت- گروهیِ تعمیم یافته در این سامانه پیاده سازی شده و نیز در ترکیب با مدل زبانیِ آماری به کار رفته است.  نتایج حاصل نشان می دهد که مدل آواییِ وابسته به بافت، مطابق انتظار، بهترین عملکرد را دارد. همچنین مدلِ زبانیِ سه کلمه ایِ مبتنی بر کلمه، نسبت به سایر روش های استخراجِ مدلِ زبانیِ آماری برتری دارد. درضمن ترکیب مدلِ زبانیِ دستوری با مدلِ زبانیِ آماری منجر به بهبود نتایجِ بازشناسی می شود. سامانۀ بازشناسیِ گفتارِ معرفی شده در این مقاله، اولین سامانۀ بازشناسی برای گفتارِ پیوسته فارسی بوده و با پشتوانۀ فعالیت های تحقیقاتیِ متعددی که برای پیاده سازیِ آن انجام شده است، قابلیت استفاده به صورت کاربردی را یافته است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

به‌کارگیریِ اطلاعاتِ زبانی در یک سیستمِ بازشناسیِ گفتار پیوستة فارسی

در این مقاله یک سامانۀ بازشناسی گفتار پیوسته برای زبان فارسی معرفی می‌شود و نقش مدل آوایی و مدل زبانی در آن مورد بررسی قرار می‌گیرد. مدل‌های آوایی با روش‌های مستقل‌از‌بافت و وابسته‌به‌بافت در این سامانه به‌کار رفته و نتایجِ به‌کارگیریِ آن‌ها ارائه شده است. مدل زبانیِ سه‌کلمه‌ای نیز با روش‌های مبتنی‌بر کلمه، مبتنی‌بر مقولة نحوی و مبتنی‌بر طبقه، با استفاده از پیکرۀ متنیِ زبانِ فارسی استخراج و در سامان...

متن کامل

بازشناسی احساس از روی گفتار پیوسته فارسی

در سالهای اخیر بازشناسی احساس به عنوان روش جدیدی برای تعامل انسان با کامپیوتر مورد توجه و موضوع تحقیقات زیادی بوده است. احساس، در قالب حرکات چهره، گفتار، حرکات دست و بدن و علایم زیستی مانند ضربان قلب بروز می یابد. مدل پیشنهادی در این پایان نامه از گفتار پیوسته فارسی برای بازشناسی احساس استفاده می کند. بازشناسی احساس از گفتار بر روی زبان های مختلفی انجام شده اما بر روی زبان فارسی تا کنون این چن...

بازشناسی گفتار پیوسته فارسی به کمک شبکه های عصبی

گفتار محصول سیستمهای تولید و درک گفتار و مغز انسان است . انسان همیشه از طریق گفت و شنود توانسته است ارتباط بهتری با محیط خود برقرار کند. بنابراین اگر بتوان از کامپیوتر بصورت سمعی و بصری بهره گرفت ، تحول بزرگی در استفاده از آنها بوجود می آید. در این پروژه، بمنظور طراحی روشهایی در بازشناخت گفتار پیوسته فارسی، شبکه های عصبی بعنوان ابزار مدلسازی انتخاب شده اند. در بخش نخست اجرای پروژه، با هدف دستیا...

15 صفحه اول

مقاوم سازی سیستم بازشناسی گفتار پیوسته

دقت سیستم¬های بازشناسی گفتار در محیط¬های آزمایشگاهی و کنترل شده به میزان قابل قبولی افزایش یافته و امروزه شاهد استفاده از این سیستم¬ها در محیط¬های واقعی هستیم. با این حال، کارایی این سیستم¬ها در حضور نویز به دلیل عدم تطابق بین شرایط و محیط آموزشی و آزمون به شدت افت می¬کند. علاوه بر این، تنوع مشخصه¬های گفتاری گویندگان نیز بر کارایی این سیستم¬ها تاثیرگذار است. در سال¬های اخیر، عمده پژوهش¬های صورت...

مدلسازی وابسته به متن در بازشناسی گفتار پیوسته بر اساس در خت تصمیم گیری آوایی فارسی

مدلسازی وابسته به متن به عنوان شیوه ای مفید برای افزایش دقت مدلسازی در بازشناسی گفتار پیوسته مورد توجه است. معمولترین شکل پیاده سازی این شیوه، استفاده از مدلهای سه آوایی است. با این همه، تعداد زیاد این مدلها موجب می شود که در عمل، آموزش سیستم با مشکلات زیادی همراه باشد و دستیابی به آموزش مقاوم (robust training) به سختی میسر گشته یا اصولا مقدور نشود. یکی از شیوه های حل این مشکل، استفاده از روش گ...

متن کامل

پایه‌گذاری بستری نو و کارآمد در حوزه بازشناسی گفتار فارسی

Although researches in the field of Persian speech recognition  claim  a  thirty-year-old  history in Iran  which has achieved considerable progresses, due to the lack of well-defined experimental framework, outcomes from many of these researches are not comparable to each other and their accurate assessment won’t be possible. The experimental framework includes ASR toolkit and speech database ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
زبان و زبان شناسی

جلد ۶، شماره ۱۱، صفحات ۸۷-۱۱۲

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023